تبدیل خودکار درختبانک وابستگی فارسی به درختبانک سازهای
نویسندگان
چکیده مقاله:
There are two major types of treebanks: dependency-based and constituency-based. Both of them have applications in natural language processing and computational linguistics. Several dependency treebanks have been developed for Persian. However, there is no available big size constituency treebank for this language. In this paper, we aim to propose an algorithm for automatic conversion of a dependency treebank to a constituency treebank for Persian. Our method is based on an existing method. However, we make modification to enhance its accuracy. The base algorithm constructs a constituency structure according to a set of conversion rules. Each rule maps a dependency relation to a constituency subtree. The constituency structure is built by combining these subtrees. We investigate the effects of the order in which dependency relations are processed on the output constituency structure. We show that the best order depends on the charactersitics of the target language. We also make modification in the algorithm for matching the conversion rules. To match a dependency relation to a conversion rule, we start with detailed infromation and if no match was found, we decrease the details and also change the method for matching. We also make modification in the algorithm used for combining the constituency subtrees. We use statistical data derived from a treebank to find a proper position for attaching a constituency subtree to the projection chain of the head. The expremental results show that these modifications provide an improvement of 16.48% in the accuracy of the conversion algorithm.
منابع مشابه
ارائۀ راهکاری قاعدهمند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساختسازهای برای زبان فارسی
In this paper, an automatic method in converting a dependency parse tree into an equivalent phrase structure one, is introduced for the Persian language. In first step, a rule-based algorithm was designed. Then, Persian specific dependency-to-phrase structure conversion rules merged to the algorithm. Subsequently, the Persian dependency treebank with about 30,000 sentences was used as an input ...
متن کاملتولید درخت بانک سازهای زبان فارسی به روش تبدیل خودکار
Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. A...
متن کاملبرچسبزنی خودکار نقشهای معنایی در جملات فارسی به کمک درختهای وابستگی
Automatic identification of words with semantic roles (such as Agent, Patient, Source, etc.) in sentences and attaching correct semantic roles to them, may lead to improvement in many natural language processing tasks including information extraction, question answering, text summarization and machine translation. Semantic role labeling systems usually take advantage of syntactic parsing and th...
متن کاملبرچسب زنی خودکار نقش های معنایی در جملات فارسی به کمک درخت های وابستگی
تتشخیص خودکار واژه های دارای نقش های معنایی (همچون کنش گر، کنش پذیر، منشأ، و ...) در جملات و اختصاص صحیح نقش های معنایی به آن ها توسط رایانه می تواند موجب بهبود کیفیت در بسیاری از کاربردهای پردازش زبان طبیعی همچون استخراج اطلاعات، پرسش و پاسخ، خلاصه سازی، و ترجمۀ ماشینی شود. در چنین پردازشی که برچسب زنی نقش معنایی و یا تجزیۀ معنایی سطحی خوانده می شود معمولاً از تجزیۀ نحوی جملات به منظور تعریف وی...
متن کاملتولید درخت بانک سازه ای زبان فارسی به روش تبدیل خودکار
درخت بانک از مهمترین و پرکاربردترین منابع مورد استفاده در زمینه پردازش زبان طبیعی است. دو نوع از پرکاربردترین درخت بانک ها، درخت بانک وابستگی و درخت بانک سازه ای است. با توجه به نبود درخت بانک سازه ای با حجم بزرگ در زبان فارسی در این مقاله به بررسی روشی ارائه شده در تبدیل درخت بانک وابستگی به سازه ای می پردازیم. سپس مشکلات این روش را در زبان فارسی و انگلیسی بررسی و با ارائه راهکارهایی کیف...
متن کاملارائۀ راهکاری قاعده مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت سازه ای برای زبان فارسی
هدف مقاله حاضر ارائۀ روشی خودکار جهت تبدیل درخت تجزیه نحوی وابستگی به درخت تجزیه نحوی مبتنی بر دستور ساخت سازه ای معادل در زبان فارسی است. برای نیل بدین هدف، الگوریتمی قاعده مند جهت این نوع تبدیل طراحی شده است. به منظور دستیابی به درخت تجزیۀ نحوی ساخت سازه ای مناسب برای جملات زبان فارسی، دستور زبان فارسی مورد مطالعه قرار گرفته و قوانین خاص زبان فارسی استخراج و به الگوریتم مذکور افزوده شده است. ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 14 شماره 4
صفحات 79- 96
تاریخ انتشار 2018-03
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023